研究多层合作研究中的一个关键挑战是不仅需要有效合作的个人代理,而且需要与谁合作。当其他代理人隐藏的情况下,可能是错误的动机和目标时,这在局势中特别关键。社交扣除游戏提供途径来研究个人如何学习如何综合有关其他人的潜在不可靠的信息,并阐明其真正的动机。在这项工作中,我们展示了隐藏的议程,这是一个双队的社交扣除游戏,为在未知团队对齐的情况下学习学习代理的2D环境。环境承认两支球队的丰富战略。在隐藏议程中培训的强化学习代理表明,代理商可以学习各种行为,包括合作和投票,而无需以自然语言沟通。
translated by 谷歌翻译
Reliable and cost-effective counting of people in large indoor spaces is a significant challenge with many applications. An emerging approach is to deploy multiple fisheye cameras mounted overhead to monitor the whole space. However, due to the overlapping fields of view, person re-identificaiton (PRID) is critical for the accuracy of counting. While PRID has been thoroughly researched for traditional rectilinear cameras, few methods have been proposed for fisheye cameras and their performance is comparatively lower. To close this performance gap, we propose a multi-feature framework for fisheye PRID where we combine deep-learning, color-based and location-based features by means of novel feature fusion. We evaluate the performance of our framework for various feature combinations on FRIDA, a public fisheye PRID dataset. The results demonstrate that our multi-feature approach outperforms recent appearance-based deep-learning methods by almost 18% points and location-based methods by almost 3% points in accuracy.
translated by 谷歌翻译
在这项工作中,我们询问并回答是什么使经典的强化学习合作。在社会困境情况下合作对于动物,人类和机器至关重要。尽管进化论揭示了促进合作的一系列机制,但代理商学习合作的条件受到争议。在这里,我们证明了多项式学习设置的哪些单个要素如何导致合作。具体而言,我们考虑了在经典环境中,在经典的环境中,具有一定的囚犯困境,并在经典的环境中使用Epsilon-Greedy探索进行了广泛使用的时间差异增强算法。两个学习代理中的每一个都学会了一种策略,该策略可以在最后一轮的两个代理商的行动选择上进行以下动作选择。我们发现,除了对未来奖励的高度关心,较低的勘探率和较小的学习率之外,这主要是加固学习过程的内在随机波动,最终合作率将最终的合作率翻了一番,高达80 \%。因此,固有的噪声不是迭代学习过程的必要邪恶。这是学习合作的关键资产。但是,我们还指出了合作行为的很高可能性与在合理的时间内实现这一目标之间的权衡。我们的发现与有目的地设计合作算法和调节不希望的犯罪效果有关。
translated by 谷歌翻译
高斯混合模型将其作为一个强大的工具,主要是在聚类问题中,但在特征提取,模式识别,图像分割和一般机器学习中也具有适当的准备。当面对模式匹配的问题时,在不同数据上计算的不同混合模型可以维持关于数据集的结构的重要信息。为了测量或比较混合模型的结果,Wassersein距离可以非常有用,但是计算混合分布并不容易。在本文中,我们从高斯混合模型之间的Wasserstein距离获得了一个可能的近似,并将其降低到线性问题。此外,显示了关于真实世界数据的应用示例。
translated by 谷歌翻译